课程主页:http://speech.ee.ntu.edu.tw/~tlkagk/courses_DLHLP20.html

视频地址:https://www.bilibili.com/video/BV1RE411g7rQ?p=1

参考资料:https://blog.csdn.net/qq_44574333/category_10304412_2.html

备注:图片均来自于课件。

这里回顾李宏毅老师的课程Deep Learning for Human Language Processing P1至P2,这部分主要介绍了课程内容。

课程内容简介

课程的名称为深度学习与人类语言处理,主要介绍了深度学习在文本与语音领域的应用,主要内容可以由下图概括:

具体来说,一共有如下六种模式:

  1. 输入:语音;输出:文本
  2. 输入:文本;输出:语音
  3. 输入:语音;输出:语音
  4. 输入:文本;输出:文本
  5. 输入:语音;输出:类别
  6. 输入:文本;输出:类别

第一种模式的典型例子是语音识别,第二种模式的典型例子是文字转语音合成,第三种模式的典型例子有语音分离和语音转换:

第四种模式的典型例子有机器翻译,聊天机器人等等“

第五种模式的例子有Speaker Recognition(识别说话的人)以及Keyword Spotting(识别关键词):

第六种模式的例子有对文本进行分类。